☰
20.5.3 엣지 디바이스를 위한 런타임: TensorRT-LLM, ONNX Runtime, Llama.cpp
Home
/
인공지능 (Artificial Intelligence, AI)
/
제목: Embodied AI & Modern Control
/
Chapter 20. 파운데이션 모델의 경량화와 엣지 배포 (Efficient Deployment)
/
20.5 추론 가속화와 런타임 최적화 (Inference Acceleration & Runtime Optimization)
/
20.5.3 엣지 디바이스를 위한 런타임: TensorRT-LLM, ONNX Runtime, Llama.cpp
20.5.3 엣지 디바이스를 위한 런타임: TensorRT-LLM, ONNX Runtime, Llama.cpp